max rank | avg. rank | sentence |
---|---|---|
70 | 37.5000 | Men du skal også selv have det godt med det. |
74 | 29.7000 | Vi skal og kan noget, som de andre ikke kan. |
88 | 34.0000 | Vi ved de er der, men vi kan ikke se dem. |
89 | 37.5000 | Jeg vil havde det til at være noget godt for dem også, ikke kun for mig. |
127 | 57.0833 | Og det bliver man jo, når man gør det andre vil have. |
131 | 31.7647 | Hvis ikke, er der så ikke noget der kan få det til at se ud som om? |
131 | 34.0000 | Hvis man ikke vil se det, så er det der ikke. |
132 | 40.9000 | Det er nok ikke mere, end jeg har godt af. |
142 | 52.1818 | Og, går jeg ud fra, meget mere hvor det kommer fra. |
149 | 32.0000 | Jeg har med at gøre for meget ud af det! |
149 | 60.2222 | Jeg ved bare ikke hvad jeg skal gøre nu. |
149 | 59.2000 | Men jeg ved ikke lige, hvad jeg skal gøre mere, end jeg gør i dag. |
149 | 71.4000 | Vi får se - og det ville jo ikke gøre noget! |
152 | 45.5000 | Men jeg vil gerne være med til at se hvad det kan blive til. |
154 | 67.6667 | Det var nok derfor jeg også ville have den. |
157 | 38.8182 | Og det er ikke alle, der er lige gode til det. |
161 | 48.2222 | Jeg ved ikke, hvordan jeg kommer ud af det. |
163 | 57.7273 | Men så kunne jeg også komme i gang med det samme. |
165 | 55.4444 | Men har ikke rigtig noget med det at gøre. |
165 | 71.6667 | Men jeg kan ikke rigtig finde andre lige nu. |
172 | 69.7000 | Jeg siger, vi alle sammen var lige gode om det. |
174 | 38.2222 | Det er noget af det jeg skal arbejde med. |
176 | 45.7500 | Jeg så det ikke, for jeg skulle tage mig af de andre. |
179 | 65.2000 | Der kom igen en dag, hvor jeg ikke kunne mere. |
180 | 62.0000 | Det har jeg ikke endnu, men det skal nok komme. |
186 | 52.6000 | Det så ud som om jeg ikke kunne gå under. |
186 | 55.5000 | Men det kan jo ikke blive ved med at gå. |
186 | 74.8889 | Men hvordan ved man, hvad man skal gå efter? |
190 | 74.4444 | Men hun er ikke noget for ham, siger han. |
190 | 61.0625 | Så vi må se om ikke også hun kan få ham til det den her gang. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II